Ссылка на практикум:

In [1]:
from IPython.display import Image

Цель данного занятия - ознакомиться с возможностями гомологичного моделирования комплекса белка с лигандом.

Для работы выберем белок жабы Bufo andrewsi LYS_BUFGA:

In [6]:
%%bash
wget http://www.uniprot.org/uniprot/P85045.fasta
--2016-04-14 16:11:00--  http://www.uniprot.org/uniprot/P85045.fasta
Resolving www.uniprot.org... 193.62.193.81, 128.175.240.211, 141.161.180.205, ...
Connecting to www.uniprot.org|193.62.193.81|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 231 [text/plain]
Saving to: `P85045.fasta'

     0K                                                       100% 23.2M=0s

2016-04-14 16:11:01 (23.2 MB/s) - `P85045.fasta' saved [231/231]


Для лизоцима форели известна пространственная структура:

In [5]:
%%bash
wget http://files.rcsb.org/download/1LMP.pdb
wget http://www.rcsb.org/pdb/files/fasta.txt?structureIdList=1LMP -O 1LMP.fasta
--2016-04-14 16:08:12--  http://files.rcsb.org/download/1LMP.pdb
Resolving files.rcsb.org... 132.249.213.77
Connecting to files.rcsb.org|132.249.213.77|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [application/octet-stream]
Saving to: `1LMP.pdb.2'

     0K .......... .......... .......... .......... ..........  121K
    50K .......... .......... .......... .......... ..........  111K
   100K .......... .......... ........                          137K=1.1s

2016-04-14 16:08:13 (120 KB/s) - `1LMP.pdb.2' saved [131301]

--2016-04-14 16:08:13--  http://www.rcsb.org/pdb/files/fasta.txt?structureIdList=1LMP
Resolving www.rcsb.org... 132.249.231.10
Connecting to www.rcsb.org|132.249.231.10|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: `1LMP.fasta'

     0K                                                        18.8M=0s

2016-04-14 16:08:14 (18.8 MB/s) - `1LMP.fasta' saved [160]


  1. Построим выравнивание последовательностей 1LMP.fasta и P85045.fasta с помощью muscle.

С помощью JalView переведём полученное выравнивание в PIR-формат.

  1. Модифицируем файл выравнивания (переименуем заголовки):
Было Стало
P1;sp|P85045|LYS_BUFGA/1-146 >P1;seq
>P1;1LMP:A|PDBID|CHAIN|SEQUENCE/1-129 >P1;1lmp

После имени последовательности моделируемого белка добавим строчку, описывающую входные параметры последовательности для modeller:

sequence:ХХХХХ::::::: 0.00: 0.00

После имени последовательности белка-образца добавим строчку, которая описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д:

structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00

В конце каждой последовательности добавим символы /. (символ "/" означает конец цепи белка. Точка указывает на то, что имеется один лиганд) и переименуем файл в test1.ali.

  1. Модифицируем файл со структурой.

Создадим управляющий скрипт lysc_bufan.py:

In []:
%%bash
echo "from modeller.automodel import *
class mymodel(automodel):
    def special_restraints(self, aln):
        rsr = self.restraints
        for ids in (('ND2:120:A', 'O7A:147:B'),
                    ('NE1:80:A', 'O3B:147:B'),
                    ('ND2:62:A', 'O1L:147:B')):
                    atoms = [self.atoms[i] for i in ids]
                    rsr.add(forms.upper_bound(group=physical.upper_distance,
                      feature=features.distance(*atoms), mean=3.5, stdev=0.1)) 
env = environ()
env.io.hetatm = True
a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
a.starting_model = 1
a.ending_model = 5
a.make()
" > lysc_bufan.py

Запустим скрипт:

In []:
%%bash
mod9v7 myscript &

Полученные структуры изображены ниже (исходная выделена белым цветом):

In [2]:
Image(filename='all.png')
Out[2]:

Видно, что смоделированные структуры очень хорошо совпали с исходной. Есть только одна петля (самая нижняя на рисунке), которая отклонилась от каркаса. Хвост, для которого не имеется каркаса, остался линейным.

In []: